خوشه بندی خودکار داده های مختلط با استفاده از الگوریتم ژنتیک

Authors

masoud yaghini assistance professor of school of railway engineering - iran university of science and technology

mahdi vard msc, school of railway engineering - iran university of science and technology

abstract

مساله خوشه بندی به منظور کمینه کردن مجموع مجذور انحراف، یک مساله غیر خطی و غیر محدب بوده و دارای تعداد زیادی نقاط بهینه محلی است. در مسائل خوشهبندی در دنیای واقعی، اغلب با مجموعه دادههایی مواجهیم که از ترکیبی از مقادیر عددی و دستهای تشکیل شدهاند. در حالیکه اغلب روشهای خوشهبندی موجود تنها بر روی دادههای عددی از کارایی مناسبی برخوردارند و قابلیت استفاده بر روی دادههای مختلط را ندارند. از سوی دیگر، بیشتر روشهای سنتی، تعداد خوشهها را به عنوان ورودی از کاربر طلب میکنند. در حالیکه در بیشتر موارد تعداد خوشهها برای کاربر مقداری نامعلوم است و حدس زدن مقدار آن نیز به خصوص در مورد مجموعه دادههای بزرگ کاری مشکل و حتی غیرممکن است. در این مقاله قصد داریم تا با بهرهگیری از روشی دقیقتر جهت اندازهگیری فاصله میان مقادیر دستهای، روش جدیدی را برای خوشهبندی دادههای مختلط ارائه نماییم که نیازی به تعیین تعداد خوشهها به عنوان ورودی الگوریتم نداشته و قادر است همزمان با خوشهبندی داده ها، مقدار بهینه برای تعداد خوشهها را محاسبه نماید. در روش پیشنهادی معکوس شاخص davies-bouldin به عنوان تابع برازش در نظر گرفته شده و به منظور جستجوی فضای جواب از الگوریتم ژنتیک استفاده میشود. برای ارزیابی عملکرد الگوریتم از دو گروه از داده های استاندارد و شبیهسازی شده استفاده شده است. نتایج بدست آمده، عملکرد بسیار بالای الگوریتم پیشنهادی را نشان میدهد

Already have an account?login

similar resources

خوشه‌بندی خودکار داده‌های مختلط با استفاده از الگوریتم ژنتیک

In the real world clustering problems, it is often encountered to perform cluster analysis on data sets with mixed numeric and categorical values. However, most existing clustering algorithms are only efficient for the numeric data rather than the mixed data set. In addition, traditional methods, for example, the K-means algorithm, usually ask the user to provide the number of clusters. In this...

full text

یک روش ترکیبی خوشه بندی مبتنی بر الگوریتم ژنتیک با استفاده از عملگر های جدید تغییر

The clustering problem under the criterion of minimum sum of squares is a non-convex and non-linear program, which possesses many locally optimal values, resulting that its solution often being stuck at locally optimal values and therefore cannot converge to global optima solution. In this paper, we introduce several new variation operators for the proposed hybrid genetic algorithm for the cl...

full text

تعیین توصیفگرهای بهینه در خوشه بندی داده های لیدار با استفاده از الگوریتم ژنتیک

در سالهای اخیر، تکنولوژی لیدار به عنوان یک تکنولوژی کارآمد در کسب اطلاعات سهبعدی از زمین شناخته شده و هر روز بیش از پیش مورد توجه مهندسین و متخصصان مهندسی ژئوماتیک قرار میگیرد. استخراج عوارض از دادههای لیدار به عنوان یکی از مسائل مهم در پردازش این اطلاعات به شمار میآید. یکی از راههای استخراج اتوماتیک عوارض از این دادهها استفاده از الگوریتمهای خوشهبندی می‍باشد. تعیین روش بهینه خوشهبند...

full text

جداسازی خودکار کانی های موجود در مقاطع نازک سنگ ها با استفاده از الگوریتم های پردازش تصویر و خوشه بندی

جداسازی خودکار کانی‌ های موجود در مقاطع نازک با استفاده از روش‌های پردازش تصویر، یکی از موضوعاتی است که در سال‌های اخیر مورد توجه زمین‌ شناسان قرار گرفته است. سنگ‌ها اصلی‌ترین منبع اطلاعاتی زمین‌ شناسان می‌باشند، و یکی از روش‌های متداول مطالعه سنگ‌ها، تهیه مقاطع نازک از آن‌ها و بررسی این مقاطع با استفاده از میکروسکوپ‌ های انکساری قطبی کننده نور است. همچنین جداسازی کانی‌ های موجود در مقاطع نازک،...

full text

بررسی میزان تأثیر داروهای درمان ناباروری در بیماران نابارور با استفاده از الگوریتم خوشه بندی و تکنیک های داده کاوی

Background and purpose: The rate of infertility has increased throughout the world. Data mining is a new method for analyzing information from databases. Few studies are done regarding infertility and using data mining in describing and predicting different treatment methods and factors influencing these methods. This paper proposes a model for evaluating the efficacy of different drugs in trea...

full text

بهینه سازی زمان بندی الگوریتم های موازی با استفاده از الگوریتم ژنتیک

In scheduling, a set of machines in parallel is a setting that is important, from both the theoretical and practical points of view. From the theoretical viewpoint, it is a generalization of the single machine scheduling problem. From the practical point of view the occurrence of resources in parallel is common in real-world. When machines are computers, a parallel program can be conceived as a...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}

Journal title:

بین المللی مهندسی صنایع و مدیریت تولید

جلد ۲۳، شماره ۲، صفحات ۱۸۷-۱۹۷

Keywords

داده کاوی خوشه بندی داده های مختلط الگوریتم ژنتیک شاخص davies bouldin

Hosted on Doprax cloud platform doprax.com